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对 音乐 音 高 感知 的 跨 领 域 影响 


aya y% 


Ar RAA” 


( 南京 师范 大 学 国际 文化 教育 学 院 ; “南京 师范 大 学 文学 院 ， 南 京 210097) 


C 中国 科学 技术 大 学 语言 交 


又 研究 中 心 , 合肥 230051) 


摘 要 采用 音 高 识别 与 区 分 任务 ,以 汉语 母语 者 、 越 南 语 母语 者 和 俄语 母语 者 为 研究 对 象 ， 考察 了 两 个 语言 加 工 
层面 的 因素 , 即 声调 范畴 感知 模式 以 及 不 同 语言 声调 系统 的 复杂 度 差 异 对 路 领 域 音乐 音 高 感知 的 影响 。 结 果 发 现 : 
(1) 汉 语 和 越南 语 两 组 声调 语言 母语 者 听 辨 结果 符合 范畴 感知 模式 ,而 俄语 母语 者 是 连续 感知 。 在 语言 和 音乐 两 种 
刺激 条 件 下 ,声调 语言 母语 者 在 范畴 边界 宽度 、 范 畴 内 区 分 率 、 范 畴 间 区 分 率 以 及 区 分 峰 度 等 指标 上 不 存在 显著 


差异 。 (2) 汉 语 和 越南 语 两 组 声调 语言 母语 者 的 音乐 音 高 区 分 任务 结果 差异 不 显著 。 实验 结果 表明 : 在 行为 层面 ， 
语 声调 范畴 感知 模式 可 以 迁移 到 音乐 音 高 感知 中 , 但 复杂 声调 系统 并 不 能 促进 跨 领域 的 音乐 音 高 精细 感知 。 实 验 


结果 从 语言 对 音乐 音 高 加 工 影响 的 角度 支持 了 “共享 论 ”。 
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1 引言 


音 高 是 语言 和 音乐 共有 的 基本 声学 属性 。 在 语 
言 中 ， 音 高 表现 为 韵律 信息 ,包括 强度 、 语 调 以 及 
声调 等 。 声 调 是 一 种 独特 的 语言 现象 ,声调 语言 通 
过 不 同 的 音 高 表达 不 同 的 词汇 语义 (Yip，2002)， 如 
汉语 普通 话 中 ,有 阴平 、 阳 平 、 上 声 和 去 声 四 个 声 
调 。 在 音乐 中 , 音 高 被 记录 成 不 同 的 音符 ,而 音 高 
序列 构成 旋律 (Krishnan et al., 2009)。 
1.1 语言 音 高 和 音乐 音 高 加 工 的 “模块 论 ” 与 “ 共 

享 论 ” 

音 高 在 语言 和 音乐 中 的 表现 既 有 共性 又 有 差 
异 ， 对 这 两 个 领域 的 音 高 加 工 也 存在 不 同 的 看 法 。 
一 些 人 研究 支持 “模块 论 ”。 如 Peretz 和 Coltheart (2003) 
基于 大 量 脑 损伤 研究 发 现 ,一 个 领域 存在 缺陷 的 病 
人 男 一 个 领域 的 功能 是 完好 的 。 他 们 认为 ,音乐 能 
力 与 语言 能 力 一 样 ， 有 自己 的 程序 和 知识 库 ， 由 此 
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提出 了 音乐 加 工 的 “模块 化 模型 *。 在 这 个 模型 中 ， 
领域 一 般 性 的 基础 声学 信息 经 分 析 后 ， 由 专门 的 子 
系统 负责 处 理 音乐 音 高 。Chen 等 (2016) 以 及 Chen 
等 (2018) 对 声调 语言 母语 者 感知 音乐 音 高 的 研究 发 
现 ， 这 一 群体 对 声调 和 音乐 音 高 的 辨别 结果 不 存在 
相关 性 , 他 们 由 此 提出 “分 裂 假 说 (Split Hypothesis)”, 
认为 声调 语言 母语 者 声调 与 非 声调 音 高 特征 分 别 
表征 ， 加 工时 激活 不 同 的 神经 网 络 。 
相反 ,更 多 的 研究 支持 “共享 论 ”"。 在 语言 能 

与 音乐 能 力 相 互联 系 的 基础 上 , Patel (2008) 提 出 二 
者 可 能 共享 加 工资 源 。 基 于 声调 和 音乐 音 高 的 物理 
共性 , Bradley (2013) 认 为 声调 的 音 高 特征 (方向 、 和 斜 
率 、 高 度 ) 与 音乐 的 音 高 特征 (轮廓 、 音 程 、 音 调 ) 
在 声学 层面 存在 映射 关系 。 大 量 以 音乐 家 为 被 试 的 
研究 认为 ， 音 乐 经 验 和 音乐 训练 有 助 于 提高 声调 的 
感知 能 力 (Schon et al., 2004; Marques et al., 2007; 
Lee & Hung, 2008; Marie et al., 2011). 据 此 , Besson 
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等 (2011) 提 出 训练 迁移 效应 ， 认 为 语言 和 音乐 共享 
神经 加 工 机 制 ,长 期 的 音乐 经 验 不 但 会 影响 两 个 领 
域 共同 的 声学 信息 加 工 ， 也 会 影响 语言 的 领域 特异 
性 知觉 。Patel (2012) 进 一 步 认 为 ， 音 乐 训 练 会 引发 
大 脑 可 塑性 变化 ,从 而 影响 语音 加 工 。 以 上 研究 立 
足 于 从 音乐 视角 看 语言 加 工 。Bidelman 等 (2013) 提 
出 ， 从 理论 上 看 ,语言 /音乐 加 工 引 发 的 大 脑 可 塑 
性 变化 是 双 同 的 , 声调 语言 母语 者 感知 音乐 音 高 也 
具有 优势 。 一 些 实证 研究 支持 了 这 一 观点 ， 发 现 无 
论 行为 层面 还 是 大 脑 皮 层 层面 ,声调 语言 母语 者 对 
音乐 音 高 的 感知 优 于 非 声调 语言 母语 者 ， 表 明 一 个 
领域 的 优势 会 迁移 至 另 一 领域 (Pfordresher & 
Brown, 2009; Giuliano et al., 2011; Bidelman et al., 
2013; Weidema et al., 2016)。 上 述 跨 领域 研究 谈 及 
声调 和 音乐 音 高 时 , 更 多 关注 了 音 高 的 领域 一 般 性 
特征 ， 即 声学 层面 上 的 基 频 变化 , 但 这 些 人 研究 并 未 
考虑 到 声调 作为 语言 要 素 , 在 感知 上 的 特异 性 问题 。 
1.2 ”声调 范畴 感知 对 音乐 音 高 感知 的 影响 

音 位 是 语言 中 能 够 区 别 意义 的 最 小 声音 单位 ， 
是 根据 语音 的 社会 属性 划分 的 单位 。 音 位 可 分 为 音 
段 音 位 和 超 音 段 音 位 ,前 者 是 从 音质 角度 划分 出 的 
不 同音 位 ,如 语言 中 不 同 的 元 音 、 辅 音 ， 后 者 是 从 
音质 以 外 的 音 高 、 音 长 等 角度 划分 出 的 音 位 ， 如 声 
调 。Liberman 等 (1957) 发 现 ， 英语 母语 者 对 于 辅音 
音 位 的 感知 属于 范畴 感知 (categorical perception, 
CP)。 范 畴 感知 指 听 音 人 受 母 语音 位 影响 , 将 音 位 
连续 统 中 多 个 不 同 的 声音 辨认 成 有 限 的 类 别 
(Liberman et al., 1957)。 受 该 研究 启发 ， 后 续 对 超 音 
段 音 位 一 一 声调 的 研究 发 现 ,声调 语言 母语 者 对 不 
同 声调 音 位 连续 统 的 感知 是 范畴 感知 ， 而 非 声调 语 
言 母 语 者 则 是 连续 感知 (Wang，1976; Hallé et al., 
2004; Xu et al., 2006; Peng et al., 2010; Shen & 
Froud, 2016)。 连 续 感 知 完全 依靠 声调 的 物理 属性 感 
知 声调 ， 听 音 人 不 能 将 这 些 等 声学 间距 的 音 听 辩 为 
离散 、 有 限 的 音 位 CXu et al., 2006)。 

由 此 可 见 , 感知 声调 时 ,范畴 感知 模式 要 求 听 
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以 往 研 究 从 三 个 角度 对 这 一 问题 进行 过 探索 ， 
但 都 存在 不 足 。 第 一 ,范畴 感知 模式 的 路 领域 影响 。 
这 类 研究 发 现 声调 语言 母语 者 对 非 语 言 刺 激 也 呈 
现 出 类 范畴 感知 模式 ， 暗 示 声 调 范畴 感知 模式 的 确 
存在 跨 领 域 迁移 (Hallé et al., 2004; Xu et al., 2006; 
Peng et al., 2010), 也 就 是 说 ， 听 音 人 可 能 会 将 语言 
中 “不 同音 高 的 刺激 感知 为 数量 有 限 的 音 位 ”这 一 
模式 跨 领域 迁移 到 其 他 领域 中 ,抑制 音 高 精细 感 
知 。 但 这 些 研究 并 未 明确 提出 范畴 感知 模式 对 音乐 
音 高 感知 的 影响 。 第 二 ,母语 声调 的 路 领域 抑制 作 
用 。 少数 研究 注意 到 母语 声调 可 能 存在 览 领域 抑制 
作用 (Bent et al., 2006; Peretz et al., 2011; Tong et al., 
2018). ùN Peretz 等 (2011) 发 现 ,汉语 普通 话 母语 者 
对 小 幅度 下 降 音 符 的 感知 比 非 声调 语言 母 话 者 差 ， 
作者 认为 可 能 是 由 于 普通 话 降 调 通 党 涉及 大 泡 围 
的 基 频 变化 , 长 期 的 普通 话 声调 经 验 降低 了 被 试 对 
降 调 的 敏感 度 。 但 是 ,这 些 研究 并 没有 明确 这 种 抑 
制作 用 与 范畴 感知 的 关系 。 第 三 , 直接 考察 声调 范 
畴 感知 模式 对 音乐 音 高 感知 的 影响 。 目 前 仅 发 现 
Chang 等 (2016)，Weidema 等 (2016) 以 及 Bidelman 
和 Walker (2017) 三 项 研究 , 但 结论 相反 。 前 两 者 发 
现 ,声调 范畴 可 能 影响 音乐 音 高 变化 辨认 的 敏感 性 ， 
支持 存在 迁移 ; 后 者 发 现 无 论 是 行为 层面 还 是 神经 
层面 , 汉语 母语 者 对 语言 感知 的 范畴 化 程度 都 高 于 
音乐 ,说明 范畴 感知 模式 是 领域 特异 性 的 ,不 能 类 
推 到 被 试 没 有 经 验 的 领域 。 值 得 注意 的 是 , 在 实验 
设计 上 , 三 项 研究 都 没 能 很 好 地 匹配 两 个 领域 的 材 
料 。Chang 等 (2016) 使 用 的 三 音符 音乐 片段 区 分 任 
务 与 典型 的 范畴 感知 区 分 任务 差异 较 大 , 且 音 符 的 
音 高 间隔 小 , 汉语 组 区 分 成 绩 不 好 很 难说 是 范畴 感 
知 的 路 领域 抑制 作用 还 是 实验 任务 本 刁难 度 过 大 。 
Weidema 等 (2016) 对 普通 话 母 语 者 、 和 荷兰 语 母 语 非 
音乐 家 和 三 兰 母 语音 乐 家 进行 的 调 类 识别 实验 发 
现 ， 普 通话 母语 者 和 荷兰 语 母语 的 音乐 家 对 上 升 、 
下 降 范 畴 的 感知 都 好 于 和 荷兰 语 母语 非 音 乐 家 ， 但 该 


音 人 忽视 绝 大 部 分 刺激 间 的 音 高 差异 ,将 不 同音 高 
的 刺激 感知 为 数量 有 限 的 音 位 ; 但 感知 音乐 音 高 时 ， 
听 音 人 需要 区 分 音 高 的 声学 差异 ， 准 确 地 感知 每 个 
音符 的 音 高 .所 以 , 声调 感知 与 音乐 感知 存在 差异 。 
结合 “共享 论 ” 这 提示 了 一 个 矛盾 : 如 果 语 言 和 音 
乐 共 享 加工 机 制 ,声调 语言 母语 者 的 范畴 感知 模式 
可 能 会 迁移 到 音乐 音 高 感知 中 , 将 声学 上 不 同 的 音 


高 感知 为 有 限 的 范畴 ， 从 而 抑制 对 音乐 音 高 的 精细 


实验 只 有 识别 任务 没有 区 分 任务 ， 且 其 中 的 “范畴 ” 
指 领域 一 般 性 的 类 别 ， 如 语言 、 音 乐 中 都 存在 升 、 
降 . 平 调 ,无 法 确定 音乐 范畴 感知 是 否 源 于 语言 迁 
移 。Bidelman 和 Walker (2017) 使 用 的 语言 材料 和 
音乐 材料 不 匹配 。 语 言 材料 是 从 /0/ 到 /a/ 元 音 连续 
统 ， 操 纵 的 变量 是 第 一 共振 峰 而 非 基 频 ; 音乐 材 
料 是 从 大 三 度 到 小 三 度 的 连续 统 ， 操 纵 的 变量 是 
基 频 。 
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1.3 ”母语 声调 复杂 度 差异 对 跨 领 域 音 高 感知 的 影响 。 程度 、 起 点 终点 音 高 、 调 值 等 , 都 比 汉语 普通 话 更 


不 同 声调 语言 (方言 ) 的 声调 复杂 度 并 不 一 样 。 
汉语 普通 话 有 4 个 声调 , 一 些 语言 (方言 ) 的 声调 系 
统 比 普 通话 更 为 复杂 : 泰语 有 5 个 声调 ,粤语 、 老 
挝 语 和 越南 语 都 有 6 个 声调 。 这 些 语言 (方言 ) 中 存 
在 多 个 平 调 、 升 调 或 降 调 ,， 只 是 音 高 不 同 。 一 些 人 研 
究 发 现 声 调 系 统 复杂 的 语言 使 用 者 有 更 精细 的 音 
高 感知 能 力 (Chen et al., 2012; Zheng et al., 2012; 
Zheng et al., 2014), Zheng 等 (2014) 通 过 ERP 研究 
发 现 , 相 比 范畴 内 刺激 ,粤语 母语 者 对 非 语言 刺激 
(合成 锯齿 波 ) 的 范畴 间 刺 激 产 生 了 更 强 的 晚期 失 匹 
配 成 分 ， 而 汉语 普通 话 母 语 者 并 没有 观察 到 这 一 效 
应 , 这 暗示 粤语 母语 者 将 更 为 精细 化 的 音 高 感知 能 
力 迁 移 到 了 非 语 言 感知 中 ,也 就 是 说 声调 系统 的 复 
杂 度 可 能 对 被 试 音 高 精细 感知 产生 路 领 域 影响 。 然 
而 ,我 们 还 未 见 到 相关 研究 ,能够 证 实 母语 声调 复 
杂 度 对 音乐 音 高 感知 的 影响 。 

综 上 所 述 ， 目 前 对 声调 语言 母语 者 的 蜂 领 域 研 
究 虽 然 揭示 了 母语 经 验 对 音乐 音 高 加 工 的 促进 作 
用 , 但 多 关注 领域 一 般 性 的 音 高 迁移 ， 也 没有 考虑 
到 声调 加 工 中 属于 语言 层面 的 影响 因素 ， 即 范畴 感 
知 模式 的 作用 以 及 不 同 语言 声调 系统 复杂 度 的 影 
啊 。 本 研究 将 语音 范畴 感知 连续 统 应 用 于 音乐 音 高 
感知 中 , 匹配 语音 刺激 与 音乐 刺激 的 音 高 特征 ,并 
以 声调 范畴 相对 简单 的 汉语 母语 者 、 声 调 范畴 相对 
复杂 的 越南 语 母语 者 为 研究 对 象 ， 同 时 选取 非 声调 
的 俄语 母语 者 作为 控制 组 ， 讨 论 以 下 问题 : (1) 母 
语 声 调 范 畴 感知 模式 能 否 迁移 到 音乐 音 高 感知 中 ? 
(2) 母 语 声调 系统 的 复杂 度 差异 能 否 对 音乐 音 高 精 
细 感 知 产 生 跨 领域 影响 ? 

对 于 第 一 个 问题 ， 本 人 研究 预期 声调 语言 母语 者 
感知 与 母语 音 高 匹配 的 音乐 音 高 时 ， 范 畴 感知 模式 
可 以 被 激活 并 迁移 。 对 于 第 二 个 问题 , 我 们 选取 越 
南 语 作为 复杂 声调 语言 的 样本 。 越 南 语 标准 语 有 6 
个 声调 调 类 ， 如 表 1 所 示 ,， 其 声学 特征 , 包括 曲折 


R1 汉语 普通 话 和 越南 语 标准 语 声调 的 调 类 和 调 值 
汉语 普通 话 调 类 调 值 越南 语调 类 调 值 
阴平 55 横 声 55 

阳平 35 AR 211 

EF 214 问 声 213 

去 声 51 Bea 21-4 

锐 声 35 

重 声 1 


注 : 越南 语 数据 源 自 咸 草 雪 (2016)。 


为 丰富 。 本 研究 预期 声调 系统 的 复杂 度 差异 能 够 路 
领域 对 音乐 音 高 感知 产生 影响 ,越南 语 母语 者 对 音 
乐音 高 的 精细 感知 好 于 汉语 母语 者 。 对 上 述 问题 的 
研究 , 可 以 明确 语言 音 高 感知 与 音乐 音 高 感知 的 关 
系 ,从 声调 的 语言 特异 性 角度 认识 “模块 论 ” 与 “ 共 
享 论 "之 争 。 


2 实验 方法 


2.1 tit 

90 人 参与 实验 ,其 中 汉语 母语 者 30 名 (以 下 简 
BR DURA”), 14 B 16 女 , 平均 年 龄 21.9 岁 ， 越 南 
语 母 语 者 30 名 (以 下 人 简称 “越南 语 组 ”), 13 男 17 女 ， 
平均 年 龄 22.1 岁 , 俄语 母语 者 30 名 (以 下 简称 “ 俄 
语 组 ”),，15 男 15 女 , 平均 年 龄 21.2 岁 !。 越 南 语 组 
和 俄语 组 都 未 接受 过 超过 1 个 月 的 汉语 训练 。 所 有 
被 试 都 未 接受 过 专业 机 构 的 声乐 或 器 乐 训 练 , 仅 有 
个 别 被 试 接受 过 业余 训练 且 少 于 3 年 。 被 试 的 童 
年 都 在 所 在 国度 过 ,无 居住 别 国 大 于 半年 的 经 历 。 
体检 报告 表明 ,所 有 被 试 的 听力 正常 , 没有 言语 、 
语言 或 神经 疾病 。 根 据 爱 丁 堡 利 手 量 表 (Oldfield， 
1971), BNE AAAI. XT 3 组 被 试 的 音乐 相关 能 
力 进行 测量 : 采用 迷你 音乐 感知 技能 测试 (Mini- 
PROMS, Zentner & Strauss，2017) 评 佑 音乐 能 力 ， 
采用 蒙特 利 尔 失 歌 症 评估 量 表 (MBEA, Peretz et al., 
2003) 评 佑 被 试 是 否 有 失 歌 症 ， 未 发 现 音 乐 能 力 异 
常 者 及 失 歌 症 者 , 对 3 组 被 试 的 评估 结果 分 别 进行 
方差 分 析 , 迷你 音乐 感知 技能 测试 F(2, 89) = 0.62, 
p = 0.540, 蒙特 利 尔 失 歌 症 评 估量 表 F(2，89) = 
1.51,p=0.227, 差异 均 不 显著 。 被 试 参加 实验 后 得 
到 一 定 的 报酬 。 
2.2 ”实验 材料 

实验 采用 范畴 感知 范式 的 识别 任务 和 区 分 任 
务 。 实 验 材 料 分 为 两 部 分 , 一 部 分 为 语音 刺激 ,一 
部 分 为 音乐 刺激 。 

实验 刺激 材料 所 使 用 的 原始 语音 样本 为 音节 
GI 无 上 下 文 语 境 ， 由 一 位 普通 话 二 级 甲 等 的 男性 
Diz, 使 用 Audition 软件 录音 , 采样 率 为 44.1 kHz。 
使 用 Praat 软件 , 构造 一 个 由 [i (汉语 普通 话 阴 平 / 


”为 避免 可 能 存在 的 方言 干扰 ,汉语 母语 者 选择 北方 方言 母语 
者 或 南方 的 普通 话 母语 者， 日 常 使 用 语言 为 普通 话 ， 水平 为 二 
级 甲 等 及 以 上 。 北 方 方 言 母语 者 方言 声调 不 多 于 越南 标准 语 的 
6 个 声调 。 越 南 语 母语 者 来 自 河内 及 附近 地 区 ， 日 常 使 用 语言 
为 越南 标准 语 。 
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越南 语 横 声 ) 到 [i] (汉语 普通 话 阳平 /越南 语 锐 声 ) 的 
连续 统 : 阴平 / 横 声 的 起 点 和 终点 音 高 值 均 设 为 225 
Hz， 保 持 终点 的 音 高 值 不 变 , 依次 降低 起 点 的 音 高 
值 , 一 直到 175 Hz, 跨度 范围 为 50 Hz, 形成 一 
包含 9 个 刺激 的 连续 统 。 在 合成 刺激 时 ,将 刺激 起 
点 音 高 的 单位 由 赫兹 (Hz) 转 换 为 等 效 矩 形 带 宽 标 
度 (equivalent rectangular bandwidth, ERB), 这 是 一 
种 心理 声学 标准 ,能 真实 地 反映 实际 感知 到 的 频率 
变化 情况 (Greenwood, 1961)。 单 个 刺激 的 持续 时 间 
为 500 ms, 接近 汉语 普通 话 和 越南 语 单 音 市 的 时 
长 ( 郭 锦 村 , 1993; 潘 武 俊英 ， 使 用 Praat 软件 
中 高 分 辨 率 的 音 高 提取 算法 ,分 别提 取 9 个 语音 刺 
激 的 音 高 轮廓 ， 合 成 同 源 的 正弦 波 连 续 音 以 模拟 音 
乐 刺 激 ， 保 证 模拟 的 音乐 刺激 与 对 应 语音 刺激 的 音 
高 轮廓 、 振 幅 和 持续 时 间 相同 。 语音 刺 激 和 音乐 刺 
激 连 续 统 的 音 高 模式 如 图 1 所 示 。 
表 2 给 出 两 类 刺激 起 始点 和 终点 的 首 高 参数 以 
及 两 类 刺激 在 各 自 领域 内 的 实际 感知 结果 。 以 刺激 
9 为 例 , 该 刺激 起 点 音 高 和 终点 音 高 分 别 为 175 Hz 
和 225 Hz, 在 语言 中 被 感知 为 普通 话 阳 平和 越南 
语 锐 声 , 在 音乐 中 近似 于 一 个 从 F3 (简谱 标记 为 4) 


225 

全 

z 

w 

N 

175 

——— yr 
0 500 


时 间 /ms 
图 1 连续 统 音 高 模式 示意 图 


ay 
"i 
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到 A3 (简谱 标记 为 6) 的 滑 音 
谱 图 如 图 2 所 示 。 
2.3 ”实验 过 程 
实验 采用 经 典范 畴 感知 研究 的 范式 ,包括 识别 
任务 和 区 分 任务 两 部 分 , 在 计算 机 上 完成 ,材料 通 
过 E-prime 3.0 软件 呈现 。 
识别 采用 ABX 任务 。 


， 该 刺激 的 波形 图 和 频 


被 试 在 每 个 试 次 中 听 到 


3 个 刺激 音 ， 听 到 第 三 个 目标 刺激 音 后 ,按键 判断 
该 刺激 的 声调 与 第 一 个 刺激 音 ( 语 音 刺激 1: BAA! 


横 声 ; 音乐 刺激 1: A3) 相 同 ( 按 “A” 键 ) 还 是 与 第 二 个 
刺激 音 (语音 刺激 9: 阳平 / 锐 声 ; 音乐 刺激 9: 
F3—>A3)4H [A] GR LE) 9 个 语音 刺激 每 个 出 现 10 
次 , 9 个 音乐 刺激 每 个 也 出 现 10 次 ,两 类 刺激 共 180 
个 试 次 。 实 验 开 始 时 , 在 黑屏 上 显示 一 个 500 ms 
的 视觉 提示 (白色 十 字 ), PRI AUR BOR TA 1、 刺 激 
9 与 目标 刺激 ,刺激 间距 为 500 ms. 

区 分 采用 AX 任务 。 被 试 在 每 个 试 次 中 听 到 两 
个 刺激 音 构成 的 一 个 刺激 对 ， 需 要 判断 两 个 刺激 是 
否 相 同 ， 相 同 按 “A” 键 , 不 同 按 “L” 键 。 刺 激 对 分 为 
两 类 , 不 同 刺激 对 中 的 两 个 刺激 相差 2 阶 ， 如 连续 


表 2 连续 统 各 刺激 的 起 始 音 高 参数 及 感知 结果 


刺激 起 始 音 起 始 音 高 DiE Ji 语音 刺激 音乐 刺激 
高 (Hz) (ERB) (Hz) (ERB) 感知 结果 感知 结 


186.87 5.48 5.98 0.12 阳平/ 锐 声 F3#—A3 
F3# ->A3 
F3— A3 


180.88 5.36 5.88 0.12 
175 5.24 


1 225 6.23 6.63 0.12 gs A3 

2 218.37 6.10 6.52 0.12 pee A3 

3 211.85 5.98 6.41 0.12 G3#—A3 
4 205.44 5.86 6.30 0.12 G3#—A3 
5 199.14 5.73 6.19 0.12 G3—A3 
6 192.95 5.61 6.09 0.12 G3—A3 
7 

8 

9 


中 


| 


Av 
Wl 


TN 


(a) 语音 刺激 


0.50 0.5 
时 间 /s 


(b) 音乐 刺激 


图 2 语音 刺激 9 和 音乐 刺激 9 的 波形 图 (上 ) 和 频谱 图 (下 ) 
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统 中 的 第 一 个 和 第 三 个 刺激 构成 刺激 对 “1-3”， 以 
此 类 推 ， 还 有 "2-4” “3-5” “4-6” “5-7° “6-8” “7-9”, 
每 个 刺激 对 重复 10 次 , 不 同 的 顺序 如 “1-3”“3-1” 各 
5 次 ; 相同 刺激 对 中 的 两 个 刺激 完全 相同 ， 从 “1-1” 
到 “9-9”。 每 个 刺激 对 重复 10 次 ,刺激 间距 为 500 mso 
语音 刺激 和 音乐 刺激 各 设置 160 个 刺激 对 ,共计 
320 个 试 次 。 实 验 开 始 时 ,在 黑屏 上 显示 一 个 
500 ms 的 视觉 提示 (白色 十 字 ), 然后 播放 刺激 对 。 

实验 试 次 以 伪 随 机 顺序 呈现 ， 以 确保 相同 试 次 
不 连续 出 现 。 刺 激 播 放 啊 度 为 80 分 贝 。 当 被 试 按 
键 判断 或 是 某 个 试 次 呈现 2500 ms 被 试 还 未 能 做 出 
判断 ， 屏幕 将 自动 出 现 500 ms 的 间隔 ,然后 开始 下 
一 试 次 。 随 机 抽取 一 半 被 试 先进 行 语言 任务 ， 再 进 
行 音 乐 任 务 ; 另 一 半 被 试 先 进行 音乐 任务 ， 再 进行 
语言 任务 。 为 使 被 试 熟悉 实验 , 在 每 部 分 正式 实验 
之 前 先 练习 ， 练 习 采 用 的 刺激 与 正式 实验 不 同 。 被 
试 可 以 一 直 进 行 练习 ， 直 到 完全 掌握 实验 要 求 。 
2.4 数据 统计 

根据 Xu 等 (2006)、Peng 等 (2010) .Jiang 等 (2012) 
的 方法 ， 识 别 任务 的 评价 标准 为 识别 回归 曲线 的 斜 
率 和 范畴 边界 宽度 两 个 指标 ， 区 分 任务 的 评价 标准 
为 范畴 内 区 分 率 、 范 畴 间 区 分 率 和 峰 度 三 个 指标 。 

将 识别 任务 结果 进行 logistic 回归 分 析 , 得 到 


回归 方程 : mn 卫 
1-P, 


-bi+bx 。 其 中 Pi 是 被 试 将 实 


验 刺 激 判 定 为 阴平 / 横 声 /A3 的 概率 , x 是 9 个 刺激 ， 
bo 是 回归 曲线 的 截 距 , bi 是 回归 曲线 的 斜率 。bi 绝 
对 值 越 大 ,范畴 化 程度 越 高 。 识 别 曲 线 的 范畴 边界 
宽度 为 P1= 0.25 和 Pi= 0.75 之 间 的 线性 距离 ， 范畴 
边界 宽度 越 小 ,范畴 化 程度 越 高 。 

区 分 任务 中 , 将 所 有 刺激 对 分 为 7 个 刺激 对 组 ， 
每 个 刺激 对 组 包含 四 类 刺激 对 。 如 ， 刺 激 对 组 “1-3” 

一 全 一 越南 语 组 
语音 刺激 


6 7 8 9 


5 
刺激 序号 
图 3 


李 贤 日 等 : 声调 范畴 感知 和 声调 复杂 度 对 音乐 音 高 感知 的 路 领域 影响 


识别 率 /% 


三 组 被 试 识别 任务 结 
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包含 “1-3”“3-1” “1-1”“3-3” 四 类 刺激 对 。 数 据 以 刺 
激 对 组 为 单位 进行 统计 。 计算 各 刺激 对 组 的 区 分 率 


os mS "D" 
Pape 计算 公式 为 : Pa =P—P(S)+P PD)。 


其 中 , S 是 刺激 对 组 中 , 两 个 刺激 相同 的 个 数 , D 是 
两 个 刺激 不 同 的 个 数 , P (S) 是 相同 刺激 对 的 个 数 与 
刺激 对 总 数 之 比 , P (D) 是 不 同 刺激 对 的 个 数 与 刺激 


对 总 数 之 比 ，P 下 是 被 试 做 出 “相同 ”判断 的 刺激 
对 与 所 有 相同 的 刺激 对 数量 之 比 ，P- 一 -是 被 试 做 
出 “不 同 ” 判 断 的 刺激 对 与 所 有 不 同 的 刺激 对 数量 
之 比 ,按照 上 述 方法 , 计算 每 个 刺激 对 组 的 正确 率 。 
范畴 间 区 分 率 为 跨越 识别 曲线 范畴 边界 位 置 (识别 
率 为 0.5 时 ， 对 应 的 识别 曲线 横 坐 标 值 ) 区 分 对 组 的 
区 分 率 均值 ， 如 被 试 识别 曲线 范畴 边界 为 5.1, JB 
么 该 被 试 范畴 间 区 分 率 为 跨越 该 位 置 的 区 分 对 组 
“4-6” 和 “5-7” 的 平均 区 分 正确 率 。 范 畴 内 区 分 率 为 该 
被 坛 其 他 5 个 刺激 对 组 的 区 分 正确 率 均值 。 峰 度 是 范 
畴 间 区 分 率 与 范畴 内 区 分 率 之 差 。 范 畴 化 程度 越 高 ， 
范畴 内 区 分 率 越 低 ,而 范畴 间 区 分 率 和 峰 度 越 高 。 


3 ”实验 结果 


识别 任务 

三 组 被 试 语言 和 音乐 刺激 的 识别 率 图 像 如 图 3 
所 示 , 汉语 组 和 越南 语 组 被 试 语音 刺激 和 音乐 刺激 
的 识别 率 较为 接近 ,在 连续 统 起 始 部 分 和 终点 部 分 
的 几 个 刺激 分 别 接近 100% 和 0， 中间 部 分 出 现 突 
AS, MM 100% 又 降 至 接近 0， 基 本 符合 范畴 感知 识别 
任务 的 特征 ， 而 俄语 组 无 论 是 语音 刺激 还 是 音乐 
刺激 ， 都 与 两 个 声调 母语 组 差距 较 大 ,接近 于 连 


3.1 


---¢--- 俄语 组 
音乐 刺激 


汉语 组 


示意 图 
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三 组 被 试 识 别 曲线 的 斜率 、 范 畴 边界 宽度 如 表 
3 所 示 。 

以 组 别 (越南 语 、 汉 语 、 俄 语 ) 作 为 组 间 因 素 ， 刺 
激 对 类 型 (语音 、 音 乐 ) 作 为 组 内 因素 ， 对 识别 曲线 
斜率 、 范畴 边界 宽度 分 别 进行 3x2 的 重复 测量 方差 
分 析 。 结 果 显 示 , 在 识别 曲线 的 斜率 上 ， 刺 激 对 类 
型 的 主 效应 显著 , FC, 87) = 6.19, p = 0.015, ns = 
0.07。 事 后 分 析 显 示 , 语音 刺激 识别 曲线 的 斜率 显 
著 小 于 音乐 刺激 , p = 0.015, 95% CI = [-0.03, 0.27]. 
组 别 主 效 应 显著 , F(2, 87) = 58.09, p < 0.001, np = 
0.57。 刺 激 对 类 型 和 组 别 的 交互 效应 显著 ，F(2， 
87)=3.29, p = 0.042。 组 别 在 刺激 对 类 型 上 的 简单 效 
应 分 析 表 明 , 在 语音 刺激 上 , 汉语 组 显著 好 于 越南 
语 组 , p = 0.002, 95% CI = [0.22, 0.90]; 汉语 组 显著 
好 于 俄语 组 , p < 0.001, 95% CI = [-1.39, -0.71]; 越 
南 语 组 显著 好 于 俄语 组 , p < 0.001, 95% CI = [-1.94, 


表 3 三 组 被 试 识别 任务 相关 指标 (n = 90) 


语音 刺激 音乐 刺激 
组 别 aes D AE eg 
越南 语 组 -1.83(0.45) 1.28(0.34) —2.20(0.58) 1.06(0.27) 
汉语 组  —2.39(0.70) 1.02(0.38) —2.43(0.54) 0.94(0.17) 
俄语 组 -0.79(0.79) 26.69(99.29) -0.83(0.84) 10.48(14.92) 


TE: 括号 内 是 标准 差 。 
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1-3 2-4 3-5 4-6 5-7 6-8 7-9 


刺激 对 序列 


图 4 三 组 被 试 区 分 任务 结 
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-1.26]。 在 音乐 刺激 上 , 汉语 组 与 越南 语 组 差异 不 
显著 , p = 0.186; 汉语 组 显著 好 于 俄语 组 , p < 0.001, 
95% CI = -1.72, -1.03]; 越南 语 组 显著 好 于 俄语 组 ， 
p < 0.001, 95% CI = [-1.95, -1.26]。 在 边界 宽度 上 ， 
刺激 对 类 型 的 主 效应 不 显著 , FA, 87) = 0.87, p = 
0.352。 组 别 主 效应 显著 , F(2, 87) = 3.40, p = 0.038, 
np = 0.07。 事 后 分 析 显 示 , 汉语 组 与 越南 语 组 差异 
不 显著 , p = 0.980; 汉语 组 显著 高 于 俄语 组 , p = 
0.027, 95% CI = [-33.01, -2.21]; 越南 语 组 显著 高 
于 俄语 组 , p = 0.026, 95% CI = [-32.82, -2.01]。 刺激 
对 类 型 和 组 别 的 交互 效应 不 显著 , F(2, 87) = 0.83, 
p = 0.352。 这 些 结果 表明 , 汉语 组 和 越南 语 组 更 为 
接近 ,他 们 与 俄语 组 差异 较 大 。 
3.2 ”区 分 任务 

三 组 被 试 语言 和 音乐 刺激 对 的 区 分 结果 如 图 4 
所 示 ， 区 分 任务 各 指标 如 表 4 所 示 。 

以 组 别 (越南 语 、 俄 语 、 汉 语 ) 作 为 组 间 因 素 ， 刺 
激 对 类 型 (语音 、 音 乐 ) 作 为 组 内 因素 ， 对 范畴 内 区 
分 率 、 范 畴 间 区 分 率 、 峰 度 分 别 进行 3x2 的 重复 测 
量 方差 分 析 。 结 果 显 示 , 在 范畴 内 区 分 率 上 ， 刺 激 
对 类 型 的 主 效应 不 显著 ，F(1，87) = 0.001, p = 
0.972。 组 别 主 效应 显著 , F(2, 87) = 4.95, p = 0.009, 
ns = 0.10。 刺 激 对 类 型 和 组 别 的 交互 效应 不 显著 ， 
F(2, 87) = 0.92, p = 0.404。 事 后 分 析 显 示 ， 越南 语 组 


---。-- 俄语 组 


音乐 刺激 


示意 图 


表 4 三 组 被 试 区 分 任务 相关 指标 (n = 90) 


a 语音 刺激 音乐 刺激 
范畴 内 区 分 率 范畴 间 区 分 率 峰 度 范畴 内 区 分 率 范畴 间 区 分 率 峰 度 
越南 语 组 0.55 (0.07) 0.60 (0.09) 0.05 (0.07) 0.56 (0.05) 0.56 (0.09) 0.07 (0.09) 
汉语 组 0.55 (0.12) 0.60 (0.15) 0.03 (0.17) 0.58 (0.06) 0.66 (0.11) 0.12 (0.12) 
俄语 组 0.51 (0.13) 0.49 (0.24) 0.07 (0.25) 0.48 (0.21) 0.51 (0.25) 0.04 (0.23) 


TE: 括号 内 是 标准 差 。 
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显著 高 于 俄语 组 , p = 0.017, 95% CI = [0.01, 0.11]; 
汉语 组 显著 高 于 俄语 组 , p = 0.004, 95% CI = [0.02, 
0.12]; 汉语 组 与 越南 语 组 差异 不 显著 ,p = 0.615. Æ 
范畴 间 区 分 率 上 ， 刺 激 对 类 型 的 主 效应 不 显著 ，F(1， 
87) = 0.36, p = 0.550。 组 别 主 效 应 显著 , F(2, 87) = 
8.27, p = 0.001, np = 0.16。 刺 激 对 类 型 和 组 别 的 交 
互 效 应 不 显著 , F(2, 87) = 0.87, p = 0.422。 事后 分 析 
显示 ,越南 语 组 显著 高 于 俄语 组 , p = 0.009, 95% 
CI= [0.02, 0.15]; 汉语 组 显著 高 于 俄语 组 , p < 
0.001, 95% CI = [0.07, 0.20]; 汉语 组 与 越南 语 组 差 
异 不 显著 , p = 0.184。 刺 激 对 类 型 和 组 别 的 交互 效 
应 不 显著 , F(2, 87) = 0.87, p = 0.422。 在 峰 度 上 ， 刺 
激 对 类 型 的 主 效应 不 显著 , F, 87) = 3.52, p = 
0.064。 组 别 主 效应 显著 , F(2, 87) = 8.80, p < 0.001, 
ns = 0.17。 事 后 分 析 显 示 ， 越南 语 组 显著 高 于 俄语 
组 , p = 0.002, 95% CI = [0.04, 0.17]; 汉语 组 显著 高 
于 俄语 组 , p < 0.001, 95% CI = [0.07, 0.20]; 汉语 组 
与 越南 语 组 差异 不 显著 , p = 0.487。 刺 激 对 类 型 和 
组 别 的 交互 效应 不 显著 , F(2, 87) = 0.87, p = 0.422. 

以 上 结果 表明 ， 两 个 声调 母语 组 区 分 任务 的 结果 基 
本 接近 ,与 俄语 组 差异 较 大 。 


4 讨论 


本 研究 考察 了 声调 感知 中 的 语言 特异 性 因素 
对 音乐 音 高 感知 的 路 领域 影响 ,选取 母语 声调 类 型 
相对 简单 、 声 调 类 型 相对 复杂 以 及 非 声调 语言 母语 
者 作为 被 试 ,讨论 语言 加 工 层 面 范 畴 感知 模式 以 及 
声调 系统 复杂 度 的 路 领域 迁移 。 
4.1 声调 范畴 感知 模式 的 跨 领 域 迁 移 

第 一 个 问题 讨论 母语 声调 范畴 感知 模式 能 否 
迁移 到 音乐 音 高 感知 中 。 实 验 结果 发 现 , 无 论 在 语 
言 还 是 音乐 条 件 下 , 汉语 、 越 南 语 两 个 声调 母语 组 
的 识别 曲线 都 出 现 了 突变 , 区 分 曲线 都 出 现 了 区 分 
WE, 都 呈现 出 了 范畴 感知 模式 。 汉 语 组 和 越南 语 组 
在 范畴 边界 宽度 、 范 畴 内 区 分 率 、 范 畴 间 区 分 率 以 
及 区 分 峰 度 等 指标 上 都 不 存在 语言 与 音乐 的 刺激 
类 型 差异 ,说 明 母 语 范畴 感知 模式 可 以 迁移 到 音乐 
音 高 感知 中 ,这 一 结论 与 预期 一 致 。 而 俄语 组 识别 
曲线 未 能 出 现 明 显 突变 ， 区 分 曲线 较为 平缓 并 出 现 
多 个 区 分 峰 ,在 五 项 指标 上 与 两 个 声调 母语 组 差异 
显著 ,在 语言 音乐 两 类 刺激 上 不 存在 显著 差异 , 说 
明 俄语 组 依靠 刺激 的 声学 属性 ， 对 语音 和 音乐 刺激 
做 出 了 较为 一 致 的 连续 感知 。 

以 往 从 语言 音 高 感知 到 音乐 音 高 感知 的 迁移 
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人 研究， 实验 任务 多 为 两 个 音符 或 音乐 片段 的 音 高 差 
异 区 分 (Pfordresher & Brown, 2009; Giuliano et al., 
2011; Hutka et al.，2015)， 结 果 发 现 声调 语言 母语 
者 的 表现 好 于 非 声 调 语言 母语 者 ,这 是 由 于 声调 母 
语音 高 曲 拱 的 加 工 经 验 提 高 了 对 音 高 感知 的 敏感 
性 ， 被 试 在 完成 实验 任务 时 只 需要 关注 音 高 的 物理 
差异 这 一 因素 (Giuliano et al., 2011)。 与 上 述 研究 不 
同 ,本 研究 主要 考察 属于 音 位 层面 的 范畴 感知 模式 
这 一 声调 加 工 因 素 的 迁移 ， 发 现在 音乐 音 高 的 识别 
和 区 分 任务 中 , 两 个 声调 母语 组 都 呈现 出 了 与 语音 
刺激 类 似 的 模式 ， 阅 明 声 调 范畴 感知 模式 可 以 迁移 
到 音乐 音 高 感知 中 。 本 研究 的 结果 支持 了 “共享 
论 ” 与 本 人 研究 结果 不 同 ,， 前 人 研究 中 ， 有 结果 表明 
声调 语言 母语 者 在 音乐 音 高 感知 中 并 不 存在 优势 。 
如 Pfordresher 和 Brown (2009) 的 研究 发 现 , 虽然 声 
调 语言 母语 者 总 体 上 对 音乐 音 高 的 感知 好 于 非 声 
调 语言 母语 者 , 但 在 音 高 区 分 任务 中 的 表现 与 非 声 
调 语言 母语 者 差异 不 显著 ， 作 者 因此 认为 音乐 和 请 
言 共享 资源 ,但 不 共享 表征 (Patel, 2008)。 本 研究 认 
为 , 得 出 此 结果 的 原因 可 能 就 在 于 上 述 人 研究 仅 关注 
音 高 的 物理 差异 ， 而 未 考虑 到 语言 层面 因素 的 影 
啊 。 在 语言 层面 范畴 感知 模式 下 ,声调 语言 母语 者 
虽 能 够 很 好 地 感知 范畴 间 刺 激 的 差异 ,但 不 能 区 分 
范畴 内 刺激 ， 将 不 同 的 音乐 刺激 感知 为 相同 的 范畴 
内 刺激 ， 抑 制 了 音 高 的 精细 感知 。Pfordresher 等 人 
的 研究 未 考虑 到 这 种 可 能 性 ， 故 得 出 与 本 研究 不 同 
的 结论 。 尽 管 也 有 学 者 提出 了 “母语 影响 “抑制 ” 
(Bent et al., 2006; Tong et al., 2018) 等 概念 , 但 并 未 
进行 详细 讨论 。 具 体 来 说 ,这 种 “母语 影响 “抑制 ” 
可 能 源 于 母语 声调 范畴 的 监 领 域 迁移 。 就 本 实验 而 
言 ， 如 果 孤 立地 看 区 分 任务 中 两 个 声调 组 的 范畴 内 
区 分 率 与 俄语 组 差异 并 不 显著 这 一 结果 , 极 有 可 能 
忽略 范畴 感知 模式 的 跨 领 域 抑制 作用 , 错误 地 认为 
声调 语言 母语 者 的 音 高 加 工 优势 未 能 迁移 到 音乐 
音 高 感知 中 ,得 出 文 持 “模块 论 ” 的 绪论。 总 之 , 进 
行 声调 母语 者 的 音乐 音 高 感知 结果 解释 时 ,应 充分 
考虑 到 范畴 感知 因素 的 作用 。 

本 人 研究 的 结果 与 Chang 等 (2016)、Weidema 等 
(2016) 基 本 一 致 而 与 Bidelman 和 Walker (2017) 不 
同 。 这 可 能 是 由 于 Bidelman 等 人 的 研究 并 未 做 到 
语音 刺激 与 音乐 刺激 的 匹配 。 一 般 情况 下 , 语言 
的 声调 与 音乐 中 的 音符 分 属 不 同 的 表征 , 声调 以 范 
畴 化 的 方式 表征 ,而 音乐 音 级 以 离散 的 方式 表征 
(Bradley，2013), 音乐 家 不 能 将 音程 知识 直接 迁移 
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到 声调 感知 中 , 声调 语言 母语 者 也 不 能 将 范畴 感知 
模式 直接 迁移 到 音乐 旋律 感知 中 。 只 有 一 个 领域 获 
得 的 特定 音 高 范畴 经 验 与 另 一 个 领域 需要 加 工 的 
音 高 信息 相 匹 配 ， 这 种 促进 效应 才 可 能 发 生 
(Asaridou & McQueen, 2013), Bidelman 和 Walker 
(2017) 使 用 的 语言 材料 是 元 首 连 续 统 ， 音乐 材料 是 
从 大 三 度 到 小 三 度 的 连续 统 ， 二 者 并 不 同 质 ， 音 高 
言 息 也 不 能 匹配 , 被 试 在 完成 音乐 音 高 区 分 任务 时 
不 能 激活 语音 的 范畴 感知 模式 。 
4.2 ”母语 声调 系统 的 复杂 度 差 异 对 音乐 音 高 感 

知 的 影响 

本 研究 的 第 二 个 问题 是 母语 声调 系统 的 复杂 
度 差异 能 和 否 影 啊 音 乐音 高 精细 度 感知 。 对 音 高 感知 精 
细 度 问题 的 考察 一 般 采 用 音 高 区 分 任务 (Pfordresher 
& Brown, 2009; Giuliano et al., 2011; Hutka et al., 
2015)。 本 实验 中 的 区 分 任务 测量 被 试 对 不 同音 高 
的 语音 /乐音 的 区 分 程度 ,可 以 反映 被 试 对 音 高 精 
细 度 差异 的 感知 。 但 研究 结果 发 现 ， 越 南 语 组 与 汉 
语 组 无 论 是 范畴 内 还 是 范畴 间 区 分 率 , 在 语言 和 音 
乐音 高 条 件 下 差异 都 不 显著 ,表明 母语 的 复杂 声调 
系统 并 不 能 促进 跨 领域 的 音乐 音 高 精细 感知 。 实 验 
结果 未 能 文 持 预 期 。 

导致 这 一 结果 的 原因 可 能 有 二 。 第 一 ， 从 语言 
角度 看 ,本 研究 的 语言 材料 是 汉语 普通 话 阴平 - 阳 
平 / 越 南 语 横 声 - 锐 声 连续 统 ， 越 南 语 组 被 试 在 感知 
时 激活 的 越南 语 声调 表征 与 汉语 组 被 试 激活 的 普 
通话 声调 表征 基本 一 致 ， 因 此 两 组 被 斌 范畴 间 区 分 
率 不 存在 显著 差异 。 较 之 汉语 普通 话 ， 越 南 语 声 调 
的 复杂 性 体现 在 玄 声 、 跌 声 等 调 类 上 , 本 人 研究 的 实 
验 材料 并 不 包含 这 些 声调 ,故而 未 能 检验 出 越南 语 
被 试 复杂 声调 系统 带 来 的 更 为 精细 的 声调 加 工 能 
Fi. Peng 等 (2010) 和 Zheng 等 (2012) 对 比 了 普通 话 
和 声调 系统 更 为 复杂 的 粤语 ,也 得 出 了 类 似 结论 。 
他 们 的 行为 研究 发 现 , 感知 汉 语 普 通话 音 高 时 ， 粤 
语 母 语 者 与 普通 话 母 语 者 在 声学 层面 未 见 差异 。 但 
fi, Zheng 等 (2012) 的 ERP 实验 发 现 , 在 语言 内 部 ， 
奥 语 母语 者 的 精细 首 高 感知 优势 可 以 癌 汉 语 普通 
话 声调 感知 迁移 ,这 种 影响 仅 发 生 在 大 脑 皮 质 层面 
而 不 能 体现 在 行为 层面 。 未 来 可 开展 神经 电 生 理 研 
究 ， 进一步 探究 母语 声调 复杂 度 差异 对 音乐 音 高 感 
知 的 路 领域 影响 问题 。 第 二 ， 从 音乐 角度 看 ， 本 研 
究 结果 发 现 , 两 组 声调 语言 母语 者 音乐 刺激 的 范畴 
间 区 分 率 都 显著 高 于 俄语 母语 者 ， 这 表明 声调 语言 
经 验 对 于 跨 领 域 的 音乐 音 高 区 分 有 显著 的 增益 作 
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用 ， 从 语言 到 音乐 这 一 方向 文 持 了 “共享 论 ” 以 及 
Besson 等 (2011) 的 训练 迁移 效应 说 。 但 根据 OPERA 
假说 (Patel，2012), 音乐 经 验 比 语言 经 验 更 能 够 促 
进 精 细 的 音 高 感知 ， 因 为 音乐 感知 需要 不 断 调节 和 
监控 音调 ， 对 编码 精度 的 要 求 更 高 。 以 往 实证 人 研究 
也 发 现 类 似 的 结论 , 在 辨别 一 些 以 声学 信息 为 基础 
的 非 母 语 声调 上 ,声调 语言 母语 者 不 如 音乐 家 
(Cooper & Wang, 2012; Chang et al., 2016)。 因 此 ， 
尽管 越南 语 的 声调 系统 较 汉语 普通 话 更 为 复杂 , 但 
与 音乐 旋律 相 比 ,越南 语调 类 数量 和 音 高 精细 程度 
仍 显 简单 ,因此 越南 语 母语 者 感知 音乐 音 高 时 ， 在 
行为 层面 没 能 产生 里 领域 的 促进 作用 。 


5 结论 


本 研究 考察 了 影响 声调 加 工 的 语言 学 因素 对 
音乐 音 高 感知 的 跨 领 域 迁 移 。 研 究 发 现 , 声调 的 范 
畴 感知 模式 可 以 迁移 到 音乐 音 高 感知 中 ; 复杂 的 母 
语 声调 并 不 能 促进 路 领域 音乐 音 高 精细 感知 。 研 究 
结果 从 语言 对 音乐 加 工 影响 的 角度 文 持 了 共享 论 ”。 
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Abstract 

Pitch is a fundamental acoustic property shared by both language and music. However, there are different 
views on the processing of tonal pitch and musical pitch. Some studies support the “modularity view”, 
suggesting that tonal pitch and musical pitch are represented separately. In contrast, more studies support the 
“shared domain-general view”, implying that there are commonalities in the processing of tonal pitch and 
musical pitch based on their physical similarities. The existing studies have mostly focused on domain-general 
pitch transfer; nonetheless, they have not considered domain specificity of the tonal pitch as a linguistic element. 
Hence, it remains unclear whether domain specificity factors, such as categorical perception and complexity of 
different tonal language experiences on speakers’ pitch processing, play a role in musical pitch perception. 

To address the above issues, ninety participants were involved in the experiment, including native speakers 
of Mandarin Chinese (with a relatively simple pitch category), native speakers of Vietnamese (with a relatively 
complex pitch category), and native speakers of Russian (nonpitched control group). A 3 (group: Vietnamese vs. 
Chinese vs. Russian) x 2 (stimulus type: speech vs. music) between-and-within-subjects design was used. A 
continuum from [i'] (closed for Yinping in Chinese and Transverse in Vietnamese) to [i'] (closed for Yangping in 
Chinese and Acute in Vietnamese) and its musical counterpart was constructed. Participants were first tested in 
an ABX identification task to determine whether the stimulus X was similar to A or B and then an AX 
discrimination task to decide whether the two stimuli in the pair were identical. The experiment was performed 
in E-prime 3.0. 

The results showed that (1) both the Chinese and Vietnamese groups showed categorical perception for 
language and music pitches. There were no differences between language and music stimuli in category 
boundary width, within-category discrimination rate, between-category discrimination rate, or discrimination 
peak for either group. The Russian group’s identification curve did not show abrupt shifts, and their 
discrimination curve was relatively flat with multiple peaks, which indicates a continuous pattern significantly 
different from the two tonal language groups. (2) There were no significant differences between the Vietnamese 
group and the Chinese group in either the within-category discrimination rate or the between-category 
discrimination rate. 

The experimental results suggest that at the behavioral level, the pattern of native tonal categorical 
perception can transfer to musical pitch perception, but tonal complexity does not facilitate cross-domain 
musical pitch perception. The findings of this study support the “shared domain-general view” in terms of the 
influence of language on musical pitch processing. 

Key words categorical perception, pitch, tone, music 


